Wissen gewinnen durch Wissen: Ontologiebasierte Informationsextraktion

نویسندگان

  • Brigitte Endres-Niggemeyer
  • Sigrid Jauris-Heipke
  • Manuela Pinsky
چکیده

Die Aufgabe der Informationsextraktion (IE) ist es, aus Texten einer Domäne gezielt die Informationen zu entnehmen, die gerade interessieren, und alle anderen zu überlesen (mehr z.B. bei Neumann 2004). Diese Aufgabe hat offensichtlich etwas mit der Fragebeantwortung (Question Answering) und mit dem themenoder fragespezifischen Zusammenfassen (Hintergrund dazu bei Afantenos et al. 2005, Endres-Niggemeyer 2004, Hovy 2003, Mani 2001, Mani & Maybury 1999) zu tun: das System soll nur die Textpassagen analysieren bzw. “verstehen”, die relevante Information beinhalten. Was relevant ist, bestimmt die aktuelle Benutzerfrage. Die klassische IE1 (Cunningham 2005) stützt sich bevorzugt auf Templates mit Attributen, die den Typ der gewünschten Informationen spezifizieren, also auf Datenstrukturen. Die Extraktionsergebnisse sind gefüllte Template-Instanzen. IE dieser Art wurden in den amerikanischen Message Understanding Conferences2 (MUC) ausgiebig evaluiert. Dabei wurden Inhalte vor allem über Named Entities gesucht und gefunden. Named Entity Recognition3 beruht auf der Verwendung der Namen von Personen, Orten, Firmen usw. Sie sind besonders leicht und sicher zu erkennen. Anstatt auf die Templates kann man sich auch zuerst auf die Inhalte, also auf die vorkommenden Wörter und Konzepte, konzentrieren und im Anschluss herausfinden, welche Strukturen (wie Relationen oder Templates) sie umgeben. Wenn nach Named Entities gesucht wird, ist man nur noch einen Denkschritt von einer ontologiegestützten Informationsextraktion entfernt, denn schließlich hat jedes Konzept einer Ontologie oder eines Thesaurus auch die wesentlichen Vorteile einer „Named Entity“. Ansätze zur ontologiebasierten IE Wissen gewinnen durch Wissen: Ontologiebasierte Informationsextraktion

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Intelligente Agenten und KI

Neuere KI-Textbücher stützen sich zur Begriffsdefinition von ” Künstliche Intelligenz“ in der Regel massiv auf den Agentenbegriff. Autonomie, Körperhaftigkeit (embodiment), Reaktivität und Situiertheit in einem komplexen Kontext sind unmittelbar mit den Begriffen Agenten und KI verwoben. Hat man in der Vergangenheit eher versucht, einzelne Maschinen mit mächtigen Wissensverarbeitungsmechanismen...

متن کامل

Einsatz eines Live Video Remote Systems in der Industrie

Arbeitsabläufe und Prozesse, sowie Maschinenanlagen gewinnen in der Industrie zunehmend an Komplexität und fordern von Serviceund Instandhaltungsmitarbeiter ein umfangreiches Wissen. Der Beitrag beschreibt das im Zuge der Produktentwicklung entstehende System, um Serviceund Instandhaltungsmitarbeiter unter Zuhilfenahme von „Wearables“ im speziellen Datenbrillen, bei komplexen Arbeitsabläufen du...

متن کامل

Messbarkeit und Beeinflussung von Eventual-Consistency in Verteilten Datenspeichersystemen

Cloudspeicherdienste und NoSQL-Systeme, die sich zunehmend größerer Beliebtheit erfreuen, bieten meist weder transaktionale Features noch strikte Konsistenzgarantien. Stattdessen wird mit Eventual-Consistency lediglich garantiert, dass alle Schreiboperationen irgendwann – jedoch zu einem undefinierten Zeitpunkt – auf allen Replika ausgeführt werden. Die Unsicherheit, wann dies passiert, stellt ...

متن کامل

Knowledge Management durch Prozess Mining mit FRED

Der Bedarf Wissen, welches sich überreichem Masse weitgehend auch elektronisch vorhanden ist, im Anlassfall verfügbar zu haben ist enorm. Knowledge Management ist daher als jene Disziplin welche sich die Lösung der vorgenannten Aufgabe zum Ziel gesteckt hat, mit einer hohen Erwartungshaltung und Interesse versehen. Die wirtschaftlichen Rahmenbedingungen wie Kostensenkung und Globalisierung gebe...

متن کامل

K3 - Wissensmanagement über kooperative verteilte Formen der Produktion und der Aneignung von Wissen zur Bildung von konzeptueller Informationskompetenz durch Nutzung heterogener Informationsressourcen - Stand und Aussichten

Zusammenfassung K3 steht für Kooperation, Kommunikation und InformationsKompetenz und ist ein von der Konstanzer Informationswissenschaft initiiertes Projekt. K3 soll einen Beitrag zur Überwindung der gravierenden Informationskompetenzdefizite leisten, wie sie bei Studierenden durch die vom BMBF veranlasste Studie „Nutzung elektronischer wissenschaftlicher Informationen in der Hochschulausbildu...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2006